iT邦幫忙

第 12 屆 iThome 鐵人賽

DAY 3
0

今天要來講卷積神經網路(Convolutional Neural Network, CNN)
CNN很適合做圖像辨識、語音辨識諸如此類帶有"特徵"的事物,像是形狀或是聲波波形
從資料中提取出特徵部位後進行比較、分類出圖片中的物件
就像我們閉著眼睛摸一顆球,我們摸到圓形的特徵並被告知這就是球,之後我們摸到任何圓圓的東西就可以辨認的出球形出來。

尋找特徵

像增加圖像銳利度、模糊、提取輪廓,很多圖像處理都是用卷積(convolution) 達成的
卷積在作的事情就是在資料上平移,每移一步就擷取給定範圍的資料,將範圍中的每個數值乘上權重並加總。

圖片來源:https://hackmd.io/@allen108108/rkn-oVGA4

圖中黃色範圍就是擷取特徵的部分,稱為卷積核,每格有不同的權重值
卷積核從圖片左上角開始滑動,滑到整張圖結束後可以得到一張特徵圖
但一個特徵並不足以完整描述一個完整物件
我們可以使用多種不同卷積核去提取出不同特徵
例如openCV在做Canny提取輪廓時,就是使用下面兩個3x3的卷積核得出兩種不同特徵後合併

而CNN中卷積核的權重不用我們自己設定,而是在一次次訓練週期中交由神經元調整
訓練完畢後得出每個卷積核的權重值。


稍微講個...

目前剛進AI領域3個月,加上筆者數學程度考量,應該會專注在概念理解上
今天先只提卷積運算的部分,明天再接下去CNN後半部分
我的篇幅應該都會很短,公司case要趕結案,壓力山大QQ

參考

https://docs.opencv.org/3.4/da/d5c/tutorial_canny_detector.html


上一篇
初探類神經網路
下一篇
教電腦瞎子摸象摸出個所以然part.2 (星期九要不要來一杯痛苦的滋味?)
系列文
為了解決財務危機從Unity跳槽來寫AI辨識的心路歷程6
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言